TCGA BRCA


TCGA-BRCA data preparation

Download TCGA-BRAC data

GDCquery link GDCquery category pdf

Select the raw reads

TCGA BRCA 프로젝트의 메타데이터

제공된 열 이름 목록은 TCGA BRCA 프로젝트의 메타데이터에서 사용된 모든 열을 나타냅니다. 각 열의 용도는 다양하며, 환자와 샘플에 관련된 상세한 정보를 포함합니다. 이 정보는 연구자가 종양의 특성, 환자의 임상 경로, 생물학적 데이터와의 관계를 분석하는 데 사용됩니다. 아래는 각 열 이름의 의미와 사용 용도를 설명합니다:

  1. barcode: TCGA 프로젝트 내 각 샘플에 대한 고유 식별 코드입니다.
  2. patient: 각 환자에게 할당된 고유 식별자입니다.
  3. sample: 샘플의 고유 식별자입니다.
  4. shortLetterCode: 샘플의 간단한 코드를 나타냅니다.
  5. definition: 샘플 유형의 정의를 설명합니다.
  6. sample_submitter_id: 제출된 샘플의 ID입니다.
  7. sample_type_id: 샘플 유형의 ID입니다.
  8. tumor_descriptor: 종양의 설명을 제공합니다.
  9. sample_id: 샘플 ID입니다.
  10. sample_type: 샘플의 유형을 나타냅니다 (예: Primary Tumor).
  11. composition: 샘플 구성을 설명합니다.
  12. days_to_collection: 샘플 수집까지 걸린 일수입니다.
  13. state: 샘플의 상태를 나타냅니다.
  14. initial_weight: 샘플의 초기 무게입니다.
  15. preservation_method: 샘플 보존 방법입니다.
  16. pathology_report_uuid: 병리 보고서의 고유 식별자입니다.
  17. submitter_id: 제출자 ID입니다.
  18. oct_embedded: OCT(광학 단층 촬영)에 포함되었는지 여부입니다.
  19. specimen_type: 표본 유형입니다.
  20. is_ffpe: FFPE(형식고정 파라핀 포매) 처리 여부입니다.
  21. tissue_type: 조직 유형입니다.
  22. synchronous_malignancy: 동시 악성 종양의 유무입니다.
  23. ajcc_pathologic_stage: AJCC 병리학적 단계입니다.
  24. days_to_diagnosis: 진단까지 걸린 일수입니다.
  25. treatments: 처리 내용입니다.
  26. last_known_disease_status: 마지막으로 알려진 질병 상태입니다.
  27. tissue_or_organ_of_origin: 기원 조직 또는 기관입니다.
  28. days_to_last_follow_up: 마지막 추적 관찰까지 걸린 일수입니다.
  29. age_at_diagnosis: 진단 당시 나이입니다.
  30. primary_diagnosis: 주 진단입니다.
  31. prior_malignancy: 이전 악성 종양의 유무입니다.
  32. year_of_diagnosis: 진단 연도입니다.
  33. prior_treatment: 이전 치료 내용입니다.
  34. ajcc_staging_system_edition: AJCC 병기 시스템 에디션입니다.
  35. ajcc_pathologic_t: AJCC 병리학적 T 등급입니다.
  36. morphology: 형태학입니다.
  37. ajcc_pathologic_n: AJCC 병리학적 N 등급입니다.
  38. ajcc_pathologic_m: AJCC 병리학적 M 등급입니다.
  39. classification_of_tumor: 종양 분류입니다.
  40. diagnosis_id: 진단 ID입니다.
  41. icd_10_code: 국제 질병 분류 코드(ICD-10)입니다.
  42. site_of_resection_or_biopsy: 절제 또는 생검 부위입니다.
  43. tumor_grade: 종양 등급입니다.
  44. progression_or_recurrence: 진행 또는 재발 여부입니다.
  45. alcohol_history: 음주력입니다.
  46. exposure_id: 노출 ID입니다.
  47. race: 인종입니다.
  48. gender: 성별입니다.
  49. ethnicity: 민족입니다.
  50. vital_status: 생존 상태입니다.
  51. age_at_index: 인덱스 시 나이입니다.
  52. days_to_birth: 출생까지 걸린 일수입니다.
  53. year_of_birth: 출생 연도입니다.
  54. demographic_id: 인구통계학적 ID입니다.
  55. days_to_death: 사망까지 걸린 일수입니다.
  56. year_of_death: 사망 연도입니다.
  57. bcr_patient_barcode: BCR 환자 바코드입니다.
  58. primary_site: 주요 발생 부위입니다.
  59. project_id: 프로젝트 ID입니다.
  60. disease_type: 질병 유형입니다.
  61. name: 이름입니다.
  62. releasable: 공개 가능 여부입니다.
  63. released: 공개 여부입니다.
  64. days_to_sample_procurement: 샘플 조달까지 걸린 일수입니다.
  65. paper_patient: 논문에 사용된 환자 데이터입니다.
  66. paper_Tumor.Type: 논문에 기술된 종양 유형입니다.
  67. paper_Included_in_previous_marker_papers: 이전 마커 논문에 포함되었는지 여부입니다.
  68. paper_vital_status: 논문에 기술된 생존 상태입니다.
  69. paper_days_to_birth: 논문에 기술된 출생까지의 일수입니다.
  70. paper_days_to_death: 논문에 기술된 사망까지의 일수입니다.
  71. paper_days_to_last_followup: 논문에 기술된 마지막 추적 관찰까지의 일수입니다.
  72. paper_age_at_initial_pathologic_diagnosis: 논문에 기술된 최초 병리학적 진단 시 나이입니다.
  73. paper_pathologic_stage: 논문에 기술된 병리학적 단계입니다.
  74. paper_Tumor_Grade: 논문에 기술된 종양 등급입니다.
  75. paper_BRCA_Pathology: 논문에 기술된 BRCA 병리학입니다.
  76. paper_BRCA_Subtype_PAM50: 논문에 기술된 BRCA 하위 유형 PAM50입니다.
  77. paper_MSI_status: 논문에 기술된 MSI 상태입니다.
  78. paper_HPV_Status: 논문에 기술된 인유두종바이러스(HPV) 상태입니다.
  79. paper_tobacco_smoking_history: 논문에 기술된 흡연력입니다.
  80. paper_CNV Clusters: 논문에 기술된 CNV 클러스터입니다.
  81. paper_Mutation Clusters: 논문에 기술된 돌연변이 클러스터입니다.
  82. paper_DNA.Methylation Clusters: 논문에 기술된 DNA 메틸화 클러스터입니다.
  83. paper_mRNA Clusters: 논문에 기술된 mRNA 클러스터입니다.
  84. paper_miRNA Clusters: 논문에 기술된 miRNA 클러스터입니다.
  85. paper_lncRNA Clusters: 논문에 기술된 lncRNA 클러스터입니다.
  86. paper_Protein Clusters: 논문에 기술된 단백질 클러스터입니다.
  87. paper_PARADIGM Clusters: 논문에 기술된 PARADIGM 클러스터입니다.
  88. paper_Pan-Gyn Clusters: 논문에 기술된 Pan-Gyn 클러스터입니다.

TCGA-BRCA Analysis

Create DESeq object

PCA plot

PCA plot version2

Differentially Expressed Genes (DEG) analysis

DEG strategy

Differentially Expressed Genes (DEG) between Tumor tissue and Normal tissue

Tumor tissue/Normal tissue

n = 1224
Tumor n = 1111
Normal n = 113




Create DEG object

DEG table

Volcanoplot

Volcanoplot with Number of DEGs

Number of DEGs

GSEA

GSEA HALLMARK

GSEA NES plot

GSEA NES plot (filtered)

GSEA table

GSEA KEGG

GSEA NES plot

GSEA NES plot (filtered)

GSEA table

ssGSEA

ssGSEA by HALLMARK

ssGSEA by KEGG

ssGSEA by KEGG version 2

Morphlogy

형태학 코드와 설명

  1. 8010/3 (Carcinoma, NOS - Not Otherwise Specified):
    • 암의 일반적인 형태로, 특정 아형으로 더 구체화되지 않은 경우 사용됩니다.
  2. 8013/3 (Large Cell Neuroendocrine Carcinoma):
    • 크고 잘 구분되는 신경내분비 세포로 구성된 암. 신경내분비 시스템에 영향을 미치는 암.
  3. 8022/3 (Pleomorphic Carcinoma):
    • 다양한 형태와 크기의 세포를 가진 암. 종종 공격적이고 예후가 나쁩니다.
  4. 8050/3 (Papillary Carcinoma):
    • 작은 손가락 모양의 돌기를 형성하는 암. 유방암뿐만 아니라 갑상선암에서도 발견됩니다.
  5. 8090/3 (Basal Cell Carcinoma):
    • 기저세포에서 발생하는 암으로, 주로 피부암의 한 형태입니다.
  6. 8200/3 (Adenoid Cystic Carcinoma):
    • 샘 모양 구조와 낭포성 공간이 있는 암. 주로 침샘에서 발생하지만 유방에서도 나타날 수 있습니다.
  7. 8201/3 (Cribriform Carcinoma):
    • 체(sieve) 모양의 구멍이 있는 암. 유방암의 아형으로, 예후가 비교적 좋습니다.
  8. 8211/3 (Tubular Adenocarcinoma):
    • 작은 관 모양의 구조를 가진 암. 유방암의 한 형태로, 예후가 비교적 좋습니다.
  9. 8401/3 (Adenoid Cystic Carcinoma):
    • (반복, 위 8200/3과 동일)
  10. 8480/3 (Mucinous Adenocarcinoma):
    • 점액을 많이 생산하는 암. 점액성 암종으로 불리며, 예후가 좋을 수 있습니다.
  11. 8500/3 (Infiltrating Ductal Carcinoma - IDC):
    • 가장 흔한 유방암 형태로, 유관을 침범하는 암. 전체 유방암 사례의 약 70-80%를 차지합니다.
  12. 8502/3 (Secretory Carcinoma):
    • 분비성 암종으로, 희귀한 유형입니다. 주로 젊은 환자에게서 발견됩니다.
  13. 8503/3 (Inflammatory Carcinoma):
    • 유방의 염증을 동반하는 공격적인 유방암 형태. 빠르게 진행되며 예후가 나쁩니다.
  14. 8507/3 (Medullary Carcinoma):
    • 경계가 명확하고 림프구 침윤이 특징인 암. 예후가 비교적 좋습니다.

meta$ajcc_pathologic_n 병리학적 N 단계 설명

  1. N0: 림프절 전이가 없음.
    • N0 (i-): 면역조직화학적으로 음성인 미세 전이가 없음.
    • N0 (i+): 면역조직화학적으로 양성인 미세 전이가 있음.
    • N0 (mol+): 분자생물학적으로 양성인 미세 전이가 있음.
  2. N1: 1~3개의 액와 림프절에서 전이가 발견됨.
    • N1a: 1~3개의 액와 림프절에서 전이가 확인됨.
    • N1b: 림프절 전이가 있지만 특정 기준에 따라 분류됨.
    • N1c: N1a 및 N1b의 조합.
    • N1mi: 미세 전이가 있음(0.2cm 이하).
  3. N2: 4~9개의 액와 림프절에서 전이가 발견됨.
    • N2a: 4~9개의 액와 림프절에서 전이가 확인됨.
  4. N3: 10개 이상의 림프절에서 전이가 발견됨 또는 특정 기준을 충족함.
    • N3a: 10개 이상의 액와 림프절에서 전이가 확인됨.
    • N3b: 특정 기준에 따른 림프절 전이.
    • N3c: 내흉 림프절 전이가 있음.
  5. NX: 림프절 상태를 평가할 수 없음.

결론
이 테이블은 TCGA_BRCA_countsMeta 데이터에서 다양한 병리학적 N 단계의 빈도수를 보여줍니다. 이를 통해 각 단계에서 림프절 전이가 얼마나 빈번하게 발생하는지를 이해할 수 있습니다. 예를 들어, N0 단계가 372개로 가장 많으며, 이는 림프절 전이가 없는 경우가 가장 흔하다는 것을 나타냅니다.

meta$ajcc_pathologic_m 병리학적 M 단계 설명

  1. cM0 (i+): 임상적으로 원격 전이가 없지만, 미세 전이가 발견된 경우.
    • 설명: 임상 검사를 통해 원격 전이가 없는 것으로 보이나, 면역조직화학적 검사에서 미세 전이가 발견된 경우를 나타냅니다.
  2. M0: 원격 전이가 없음.
    • 설명: 환자의 몸 전체를 검사했을 때, 원격 전이가 없는 경우를 의미합니다. 이는 가장 흔한 상태로, 1016명의 환자가 이 단계에 해당합니다.
  3. M1: 원격 전이가 있음.
    • 설명: 다른 장기나 부위로 암이 전이된 경우를 의미합니다. 24명의 환자가 이 단계에 해당합니다.
  4. MX: 원격 전이 상태를 평가할 수 없음.
    • 설명: 환자의 원격 전이 여부를 평가할 수 없는 경우를 의미합니다. 176명의 환자가 이 단계에 해당합니다.

결론 이 테이블은 TCGA_BRCA_countsMeta 데이터에서 다양한 병리학적 M 단계의 빈도수를 보여줍니다. 이를 통해 각 단계에서 원격 전이의 발생 빈도를 이해할 수 있습니다. 예를 들어, M0 단계가 1016개로 가장 많으며, 이는 원격 전이가 없는 경우가 가장 흔하다는 것을 나타냅니다.